检索结果

Select

1. 基于优化卷积神经网络结构的交通标志识别

王晓斌, 黄金杰, 刘文举

计算机应用 2017, 37 (2): 530-534. DOI: 10.11772/j.issn.1001-9081.2017.02.0530

摘要（546）

PDF （868KB）（895）

现有算法对交通标志进行识别时，存在训练时间短但识别率低，或识别率高但训练时间长的问题。为此，综合批量归一化（BN）方法、逐层贪婪预训练（GLP）方法，以及把分类器换成支持向量机（SVM）这三种方法对卷积神经网络（CNN）结构进行优化，提出基于优化CNN结构的交通标志识别算法。其中：BN方法可以用来改变中间层的数据分布情况，把卷积层输出数据归一化为均值为0、方差为1，从而提高训练收敛速度，减少训练时间；GLP方法则是先训练第一层卷积网络，训练完把参数保留，继续训练第二层，保留参数，直到把所有卷积层训练完毕，这样可以有效提高卷积网络识别率；SVM分类器只专注于那些分类错误的样本，对已经分类正确的样本不再处理，从而提高了训练速度。使用德国交通标志识别数据库进行训练和识别，新算法的训练时间相对于传统CNN训练时间减少了20.67%，其识别率达到了98.24%。所提算法通过对传统CNN结构进行优化，极大地缩短了训练时间，并具有较高的识别率。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用

晁浩杨占磊刘文举

计算机应用 2013, 33 (10): 2939-2944.

摘要（497）

PDF （1052KB）（529）

发音特征表征了语音的发音方式信息，能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上，将发音方式划分为19类，并提出利用阶层式多层感知器计算语音信号属于各类的后验概率，作为发音特征。之后，将发音特征与传统的韵律特征一起用于声调建模。实验结果显示，加入发音特征后，在三种不同的建模方法下声调识别的准确率提升约5%。将声调模型融入大词表连续语音识别系统后，汉字错误率有了明显的下降

相关文章 | 多维度评价

Select

3. 汉语语音识别中基于音节的声学模型改进算法

晁浩杨占磊刘文举

计算机应用 2013, 33 (06): 1742-1745. DOI: 10.3724/SP.J.1087.2013.01742

摘要（897）

PDF （691KB）（662）

针对汉语语音识别中协同发音现象引起的语音信号的易变性，提出一种基于音节的声学建模方法。首先建立基于音节的声学模型以解决音节内部声韵母之间的音变现象，并提出以音节内双音子模型来初始化基于音节声学模型的参数以缓解训练数据稀疏的问题；然后引入音节之间的过渡模型来处理音节之间的协同发音问题。在“863-test”测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了12.13%,表明了基于音节的声学模型和音节间过渡模型相结合在解决汉语协同发音问题上的有效性。

参考文献 | 相关文章 | 多维度评价